El polaco, seguido del francés, el italiano y el español, ese es el top-4 de los idiomas con los que la Inteligencia Artificial (IA) se siente más cómoda. Sí, ni el inglés ni el chino, son las lenguas predilectas para que los modelos aprendan.

Dar por hecho que las IA pensaban en inglés estaba solventado en que el mayor volumen de datos que se maneja en internet están cargados en esos dos idiomas. 

El estudio fue realizado por investigadores de la Universidad de Maryland y Microsoft, quienes analizaron el rendimiento de varios modelos lingüísticos -entre ellos OpenAI, Google Gemini, Llama, DeepSeek y Qwen- al procesar instrucciones y textos en 26 idiomas distintos.

El polaco obtuvo un 88 % de eficacia, seguido del francés con 87, el italiano con un uno por ciento menos y el español con el 85. El inglés, por su parte, quedó relegado al sexto lugar con un 83,9 %. Y el chino, pese a su enorme volumen de datos que también aporta en la nube, ocupó el penúltimo puesto.

La explicación

“Resulta que los humanos tienen problemas con él (el idioma polaco), pero no la IA”, ironizó la Oficina Polaca de Patentes en una publicación en las redes sociales que celebraba el hallazgo. En la investigación los científicos explican que, si el polaco es el idioma más cómodo para la IA, tiene que ver con que posee estructuras sintácticas muy regulares y un uso consistente de prefijos y sufijos, lo que facilita a los modelos detectar patrones y ejecutar órdenes con mayor precisión. 

Puede que en la web el texto disponible en polaco, en cuanto a cantidad, sea menor, pero es menos complejo y para un sistema eso es más fácil de entender. Por ese motivo, el español también se benefició de su regularidad gramatical y de su enorme difusión global, situándose muy cerca del podio.

Los 10 primeros

Polaco 88%
Francés 87%
Italiano 86%
Español 85%
Ruso 84%
Inglés 83.9%
Ucraniano 83,5%
Portugués 82%
Alemán 81%
Holandés 80%